code point(码位/编码点):在字符编码体系(尤其是 Unicode)中,用一个整数值来唯一标识一个字符的“位置”。例如 Unicode 的 U+0041 表示字符 A。
(注:在不同语境中也可能泛指“字符编号”,但最常见指 Unicode 码位。)
/ˈkoʊd pɔɪnt/
A code point identifies a character in Unicode.
码位用于在 Unicode 中标识一个字符。
When converting UTF-8 text to UTF-16, you must decode the byte sequence into code points first, then re-encode them, especially for characters outside the Basic Multilingual Plane.
把 UTF-8 文本转换为 UTF-16 时,必须先将字节序列解码为码位再重新编码,尤其是遇到基本多文种平面(BMP)之外的字符时。
code point 由 code(编码) + point(点/位置) 组成,字面意思是“编码中的一个位置/点”。在 Unicode 相关讨论中,这个词用于强调:字符的抽象编号(码位)与具体存储形式(如 UTF-8 的字节、UTF-16 的码元)是不同层级的概念。